La compression audio-numérique




Pour certaines applications comme la diffusion (télé, radio, internet) cette quantité d'information est un handicap. C'est le cas du cinéma avec 6 ou 8 canaux de diffusion et un support imposé. C'est pourquoi on s'est rapidement attaché à réduire le nombre d'information en comprimant le son numérique. Cette compression est un nouveau type de code, ou codec.


|
V

Pour réussir, cette compression doit être transparente et l'auditeur doit être incapable de la déceler. Pour atteindre cet objectif, la réduction de débit audio-numérique s'appuie sur les propriétés de l'oreille humaine. La psycho-acoustique et l'étude des sensations et perceptions auditives ont permis de mettre au point des systèmes de codage perceptuel du son.


|
V

Ils sont basés sur l'effet de masque. Un son précédé ou suivi par un autre son plus fort que lui sera en partie ou totalement masqué. Le niveau de masquage dépend du niveau du son masquant mais aussi de sa fréquence et de l'intervalle qui le sépare du son masqué. Il est normal que la fréquence intervienne dans l'effet de masque puisqu'il dépend directement de la sensibilité de l'oreille humaine. On peut faire une analogie entre cette inertie temporelle de perception auditive et la persistance rétinienne qui permet au mouvement cinématographique d'exister.


|
V

Appliqué à la compression audio-numérique, l'effet de masque permet de ne transmettre que les sons réellement détectés par l'oreille. Tous les sons masqués sont éliminés. Le codeur découpe le signal numérique en bande de fréquence (filtre en peigne) et analyse le niveau de masquage pour chaque bande. Il en déduit le niveau de quantification de chaque bande, où dit autrement, le nombre d'échantillons non masqués qui doit être transmis. On ne retient au final que l'information pertinente pour l'oreille de l'auditeur. La compression permet de réduire le débit binaire dans un rapport de 1 à 6 et même 1 à 12. Soit une transmission de 25% à 8 % seulement du signal original. Elle tient compte de la fréquence d'échantillonnage (32 KHz radio DAB; 44,1 KHz CD; 48 KHz professionnel).


|
V

La compression la plus connue est sans conteste le MP3, ou MPEG couche III, mis au point par le CCETT en France et l'IRT en Allemagne.


  • précédent
  • retour
  • suivant